import pandas as pd
import os

# 读取包含MMSI和聚类标签的CSV文件
df = pd.read_csv("Data/DTW/CSJ/New_Human_Trajectories/cluster_mmsi_pairs.csv")

# 创建保存分组MMSI的目录
output_dir = "./Data/Groups/CSJ/New_Human_Trajectories/MMSI_Cluster_Groups"
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

# 根据聚类标签对MMSI进行分组
grouped = df.groupby('Cluster')

# 遍历每个聚类标签和对应的分组
for cluster_label, group in grouped:
    if cluster_label == -1:
        continue  # 如果不想包含噪声点（聚类标签为-1的数据点），则跳过

    # 为每个聚类创建一个CSV文件，只包含该聚类的MMSI
    filename = f"cluster_{cluster_label}_mmsis.csv"
    file_path = os.path.join(output_dir, filename)

    # 保存MMSI到CSV文件
    group[['MMSI']].to_csv(file_path, index=False)
    print(f"Saved MMSIs for cluster {cluster_label} to {file_path}")
